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ECHANTILLONNAGE - ESTIMATION 


- Partie A - Echantillonnage - 

L'objectif de cette partie est de repondre a la problematique suivante : comment , a partir d' informations ( couple 
moyenne-ec art-type ou proportion) connues sur une population, peut-on prevoir celles d'un echantillon ? 


Nous distinguerons deux cas : celui ou l'on etudie une moyenne dans un echantillon et celui ou l'on etudie une 
proportion dans un echantillon. 


A.1. Etude de la moyenne d'un echantillon 


On dispose d'une population sur laquelle est definie une variable aleatoire X dont on connait l'esperance (ou la 
moyenne) p et l'ecart-type a. 

Population 



On s'interesse aux echantillons de taille n. Auront-ils tous la meme moyenne ? Non, certains peuvent etre 
constitues d'elements atypiques et avoir une moyenne tres differente de celle de la population (surtout si 
l'echantillon est de petite taille). 

Notons X la variable aleatoire qui, a chaque echantillon de taille n , associe sa moyenne ( X s'appelle encore la 
distribution des moyenne s des echantillons). Que peut-on dire de cette variable aleatoire X ? 


Theoreme Central Limite - Version 1 - (Version faibie) 

Contexte : variable aleatoire X qui suit une loi normale sur la population 

X ^ A(p ; a) 

On preleve, au hasard, un echantillon (tirages avec remise (1) ou assimiles) de taille n de moyenne X . 
Alors la variable aleatoire X suit egalement une loi normale : 


f 


X^ N 


M- 


V 



Attenuation de la dispersion par 
le processus d'echantillonnage. 


^ Un tirage avec remise est encore appele "tirage non exhaustif'. Si on fait un tirage sans remise (tirage exhaustif), on modi tie la taille de la 
population au fur et a mesure des tirages, ce qui compliquerait les calculs (intervention d’un facteur d'exhaustivite). Ceci dit, pour des grandes 
populations le tirage sans remise s'assimile a un tirage avec remise. 
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Demonstration : 


Notons E = [x i ; jc 2 ; ; x n ) un echantillon de n elements preleves au hasard dans la population. 

Pour tout i compris entre 1 et n, notons X t la variable aleatoire correspondant a la valeur du /-erne element x t de 
1'echantillon. Nous savons, par hypothese, que : 

E(Xi) = p et <j(Xi) = a 

La moyenne X des n valeurs de 1'echantillon est : 

+ x 2 +... + X n 

n 

D'apres les proprietes de la loi normale, nous savons qu'une combinaison lineraire de variables aleatoire qui 

suivent la loi normale est encore une variable aleatoire qui suit la loi normale. Comme chaque variable 

aleatoire X t suit ici la loi normale N(\x, a), la variable aleatoire moyenne X suit done egalement une loi 

normale. Calculons ses parametres. 

D'apres la propriete de linearite de l'esperance : 

E(X l ) + E(X 2 ) + ...+ E(X n ) 

^ n n 


D'apres les proprietes de la variance : 



V(X l ) + V(X 2 ) + ... + V(X n ) 


2 _2 

no _ a 

2 _ 

n n 


D'ou : 



Theoreme Central Limite - Version 2 - (Version forte) 

Contexte : variable aleatoire X qui suit une loi quelconque sur la population avec E(X) = p et o(X) = a. 
On preleve, au hasard, un echantillon (tirages avec remise ou assimiles) de taille n , avec n > 30, de moyenne X 


Alors la variable aleatoire X suit approximativement une loi normale : 


f 


X^N 


p; 


a 


A 


v 


nj 


Ce theoreme du aux mathematiciens De Moivre et Laplace est de demonstration tres difficile. II est admis ici. 


a 


Remarque : il ne faut pas confondre l'ecart-type — = de la variable aleatoire X (qui est definie sur l'ensemble 


des echantillons possibles de taille n) avec l'ecart-type d'un echantillon preleve. L'ecart-type de 1'echantillon 


preleve n'interviendra pas dans nos calculs dans cette partie. Pour eviter cette confusion, la quantite 
parfois appelee " erreur type ". 


a 


sera 


Exemple : 

Les statistiques des notes obtenues en mathematiques au BAC STI en France pour l'annee 2006 sont : 

Moyenne nationale : p =10,44 

/ 

Ecart-type : a = 1 ,46 

Une classe de BTS comporte 35 eleves en 2006/2007 issus d'un BAC STI en 2006. 
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Calculer la probability que la moyenne de cette classe soit superieure a 10. 


Ici, nous ne connaissons pas la loi sur la population, mais l'effectif n de l'echantillon est superieur a 30. 
Nous allons done pouvoir utiliser le T.C.L. 2. 

Notons X la variable aleatoire qui, a tout echantillon de taille n = 35, fait correspondre sa moyenne. 


f 


Alors : 


X^N 


p; 


v 


a 

yfn 




f 


= N 


10,44; 


J 


V 


1,46 ^ 

V35 y 


X -10 44 

Posons T = — — E — ainsi T ^ N ( 0 ; 1). 

1,46 

V 35 


Nous obtenons alors par centrage et reduction 

f \ 


P( X > 10) = P 


X -10,44 > 10-10,44 


V 


1,46 

V35 


1,46 

V35 


J 


= P(T> -1,78) 
= P(T < 1,78) 

= n(l,78) 



Et par lecture directe de la table de la loi normale centree-reduite : 


n(l,78) = 0,9625 


Conclusion : il y a environ 96% de chance que, dans cette classe de BTS, la moyenne des notes au baccalaureat 
de Mathematiques soit superieure a 10. 


A.2. Etude d'une proportion dans un echantillon 

Cette fois-ci, on dispose d'une population sur laquelle on etudie un caractere (ou attribut) A dont on connait la 
proportion p dans la population. Population 



On s'interesse aux echantillons de taille n. La proportion du caractere A dans les echantillons sera-t-elle 
toujours la meme ? Evidemment non, cette proportion varie en fonction de l'echantillon choisi. Notons F la 
variable aleatoire qui, a chaque echantillon de taille n , associe sa proportion du caractere A (F s'appelle 
distribution des frequence des echantillons). Que peut-on dire de cette variable aleatoire F ? 


www . COURS-FS JES . blogspot . com 


Theoreme 

Contexte : une population sur laquelle on etudie un caractere A repandu avec une frequence p. 
On preleve, au hasard, un echantillon (tirages avec remise ou assimiles) de taille n avec n > 30. 

On note F la frequence du caractere A dans l'echantillon. 

Alors la variable aleatoire F suit approximativement une loi normale : 


f 


F^ N 


P\ 


V 


po - P) 


n 


\ 

J 


Demonstration : 

Nous allons avoir ici un modele binomial ou apparente dont on sait qu'il converge vers la loi normale. 
Pour tout i compris entre 1 et n, notons X t la variable aleatoire definie par : 

1 si le /-erne element de l'echantillon possede fattribut A 


Xi = i 


0 sinon 


La variable aleatoire X, suit une loi de Bernoulli de parametre p. 

La variable aleatoire X = X\ + X 2 + ... + X n est done binomiale de parametres n et p : 

^ * B(n, p) 

En consequence : E(X) = np et <j(X) = y]np( 1 - p) 


La variable aleatoire F= — correpond ainsi a la frequence de l'attribut A dans l'echantillon. 

n 

D'apres les proprietes de l'esperance et de l'ecart-type : 


IpO-p) 


n 


n 


n 


Exemple : 

Une election a eu lieu et un candidat a eu 40 % des voix. 

On preleve un echantillon de 100 bulletins de vote. 

Quelle est la probabilite que, dans l'echantillon, le candidat ait entre 35 % et 45 % des voix ? 


Ici, nous avons n = 100 et p = 0,4. La variable aleatoire F correspondant a la frequence des votes pour le 
candidat dans l'echantillon verifie done : 


( 


F^ N 


0,4; 


v 


'0,4x0, 6 
100 


A 


J 




\ 

J 


Posons T = 


F -0,4 



ainsi T N ( 0 ; 1). Nous obtenons alors par centrage et reduction : 


F(0,35 < F ^ 0,45) = F(-l,02 ^ T ^ 1,02) = 211(1,02) - 1 


Et par lecture directe de la table de la loi normale centree-reduite Ll(l,02) = 0,8461. 
D'ou : P( 0,35 < F ^ 0,45) = 0,6922 


II y a done environ 69 % de chance que, dans un echantillon de taille n = 100, le candidat ait entre 35 % et 
45 % des voix. 
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En analysant l'exercice ci-dessus, on constate que l'on dispose des informations sur la population (ici, 
l'ensemble des votes) parce que l'election a deja eu lieu. On en deduit des informations sur l'echantillon. Mais, 
dans la pratique, c'est souvent le phenomene reciproque que nous etudierons : les elections n'ont pas encore eu 
lieu et on voudrait retrouver les informations sur la population grace un sondage realise sur un echantillon. 
D'ou la deuxieme partie de ce document consacree a l'estimation. 


- Partie B - Estimation - 

L'objectif de cette partie est de repondre a la problematique suivante : comment , a partir d' informations ( couple 
moyenne/e cart -type ou proportion) calculees sur un echantillon, retrouver ou plutot estimer celles d'une 
population entiere ? L'estimation est le probleme reciproque de Tech antillonn age. (Mais nous aurons besom des resultats 
etablis sur la theorie de l'echantillonnage pour passer a la phase estimative). 


Nous distinguerons deux cas : celui ou l'on cherche a estimer la moyenne ju d'une variable aleatoire definie sur 
une population et celui ou l'on cherche a estimer la proportion d'individus p ayant tel caractere dans la 
population. 


ESTIMATION d'une MOYENNE 


ESTIMATION d'une PROPORTION 


Population 



Population 



B.l. Estimation d'une moyenne 


B. 1 . 1 . Estimation ponctuelle 

Contexte : on considere une variable aleatoire X sur une population de moyenne (ou esperance) p inconnue et 
d'ecart-type a inconnu (ou connu). On suppose que l'on a preleve un echantillon de taille n (tirage avec remise 
ou assimile) sur lequel on a calcule la moyenne p e et l'ecart-type a e . 


Une estimation ponctuelle de la moyenne p de la population est : 

h =Pe 

Une estimation ponctuelle de l'ecart-type a e de la population est : 




a 



n 


n - 1 
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Le coefficient 


n 


n - 1 


s'appelle correction de biais. Lorsque la taille n de l'echantillon est assez grand (en 


pratique n > 30), ce coefficient est tres voisin de 1, si bien que, dans ce cas, on peut estimer o' ^ a e . 


Exemple : 

Une universite comporte 1500 etudiants. On mesure la taille de 20 d'entre eux. La moyenne p e et l'ecart-type a e 
calcules a partir de cet echantillon sont : 


p e = 176 cm et a e = 6 cm 

Nous pouvons done estimer les parametres de la population : 


p' = 176 cm et a = 


'20 

19 


x 6 ^ 6,16 cm 


Remarque : 

Nous n'avons fait qu'une estimation, il est bien sur impossible de retrouver les vraies caracteristiques p et a de 
la population. 

L'estimation ponctuelle permet surtout de disposer d'une valeur de reference pour poursuivre/affiner les calculs. 
On souhaiterait notamment pouvoir faire une estimation par intervalle, en controlant le risque pris. 

B.1.2. Estimation par intervalle de confiance 

Le contexte est le meme que le precedent, sauf que nous allons raisonner en deux temps, une phase a priori (ou 
previsionnelle) dans lequelle on suppose que l'echantillon n'est pas encore preleve et une phase a posteriori 
dans laquelle on suppose connue la moyenne p e et l'ecart-type a e de l'echantillon et done la moyenne estimee p 
et l'ecart-type estime 0 s de la population. 


- PHASE A PRIORI - Mise en place du modele previsionnel - 


Nous avons vu, dans la theorie sur l'echantillonnage, que si X est la variable aleatoire correspondant a la 
moyenne d'un echantillon de taille n pris au hasard, alors le Theoreme Central Limite permet d'affirmer que X 


suit approximativement une loi normale : 


f 


X ^ N 


P ; 


a 


A 


v 


nj 


Nous allons chercher un intervalle qui contient p avec une confiance arbitraire de 95% (cela poumrit aussi etre 99% ou 


un autre coefficient de confiance). Nous cherchons done un rayon r tel que : 


Probability que la moyenne \i de la 
population tombe dans un intervalle 

du type [ X - r ; X + r] 


> P(X-r^p^X + r) = 0,95 



X-r 


- 3 - 

X + r 
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Cette disposition des inegalites n'est pas pratique mais il y a une correspondance remarquable entre deux 
evenements qui va nous faciliter les calculs : 

X - r F jli F X + r 

Retranchons X et p dans chaque membre : 

- p - r F - X F r - p 

Multiplions par -1: r + \x> X > \x - r 

Remettons les inegalites dans l'ordre croissant : 

p - r F X ^ r + p 

Nous sommes ainsi ramenes a calculer : 


Cette propriete decoule de la 
symetrie de la valeur absolue : 
\X-Y\^r 

Cela signifie que l'ecart entre X 
et Y est inferieur a r, ce qui s’ecrit 
indifferemment : 

—r < X — Y < r 
Y-r ^X^Y+r 
Ou encore : 

-r « Y-X^r 
X-r^ Y^X+r 



X p 

E ~ H — 3 


p- r 


p + r 


Dans la pratique, nous part irons 
de cette ecriture pour determiner 
un intervalle de confiance. 


On sait que la variable aleatoire T = — — — = ^-( X -p) suit la loi normale centree-reduite N( 0 ; 1). 

cj a v 

Nous obtenons done, par centrage et reduction : 


f 


\ 



p-r-p ^ 

X-p 

^ p + r-p 

= 0,95 

On constate ici que le fait de ne pas 

a 

a 

a 

connaitre p n’est pas genant, a ce stade. 


yfn 

yjn J 




r r4~n T r4n ^ 


v 


a 


a 


= 0,95 


J 


f r ^ n <t <: 


v 


a 


a 


= 0,95 


J 


2YI 


( r\ 

r^Jn 


v a J 


- 1 = 0,95 


n 


f r \ 

r^Jn 


V a J 


= 0,975 


Rappel : si T **+ N { 0 ; 1) alors : 

P(-a < T < a) = 211(a) -1 
En effet : 

P {— a < T «£ a) = 11(a) - II(-a) 

= n(a) - (1 - n(a)) 
= 211(a) -1 


Ll(7) = 0,975 out = 


‘yfn 


a 


Nous cherchons done, par lecture inverse de la table de la loi normale centree reduite une borne t telle que 

Yl(t) = 0,975 

La borne t = 1,96 convient. 

La borne t depend du coefficient de confiance choisi. 

Avec un coefficient de confiance de 99%, nous aurions obtenu : 


2fl 


f r \ 

r^Jn 


V a J 


- 1 = 0,99 
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U(t) = 0,995 
t = 2,515 


Par la suite, nous noterons t le reel tel que 211(0 - 1 = C ou C est le degre de confiance choisi. 


Ainsi, notre reel r recherche est tel que : 


'yfn 


a 


= t 


Le rayon r de l'intervalle cherche est : 



- PHASE A POSTERIORI - Utilisation des valeurs estimees ponctuellement - 

Nous supposons maintenant que l'echantillon a ete tire, nous obtenons done une representation p, e de la 


variable aleatoire X : 


p m 


[ 1 1 ] 


p e - r 


p e + r 


Nous pouvons affirmer que l'intervalle obtenu pour cet echantillon 


a a 

Pe-*-/= ’ 


yfn 


fait partie d'une famille dans laquelle 95 % contiennent la vraie moyenne p de la population. 
On l'appelle intervalle de confiance a 95 % (ou autre selon le coefficient de confiance decide prealablement). 


Pour calculer les bornes de cet intervalle, deux cas de figure se presentent selon que nous connaissons ou pas 
l'ecart-type a de la population. S'il est connu, il n'y a rien a faire : 


IC = 


a a 


yfn _ 


Si l'ecart-type a de la population n'est pas connu, on le remplace par son estimation ponctuelle = A / n a e . 

n — 1 


Dans ce cas, nous obtenons : 


r= t A 


n 


= t 




n — 1 -Jn yfn — l 


Nous pouvons done estimer avec une confiance de 95 % (ou 99 % selon le cas) que la moyenne p de la 


population appartient a l'intervalle : 


IC = 


He"* 


(J, 


yfn - 1 


; p e +f 




yfn — T 


On ne retiendra pas cette formule. 
Dans la pratique, on refait les calculs. 


Remarques : 

• L'intervalle de confiance est centre en la valeur p e car e'est la seule valeur de reference que nous disposons. 

• Le centre de l'intervalle de confiance (a savoir p e ) depend de l'echantillon choisi (puisque p e en depend). 
Son rayon en depend aussi lorsqu'on ne connait pas l'ecart-type de la population. 

• La vraie valeur p de la moyenne de la population peut ne pas appartenir a l'intervalle de confiance. 

• Le rayon de l'intervalle de confiance (a savoir la quantite r =t-y= ) depend du degre de confiance C choisi. 

yjn 

Plus le degre de confiance C est proche de 100%, et plus la borne t sera elevee et done le rayon grand. 
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Illustration : 


p 

Population L 


> X 


Echantillon 1 


Echantillon 2 


Echantillon 3 


E 


P = Pe 


E 


99% 


E 


P = Pe 


E 


■> 


99% 


il =p e 

[ 1 1 ] 


95% 


Un intervalle de 
confiance ne contient 
pas forcement la 
moyenne p de la 
population. 

Un intervalle de 
confiance a 95 % est 
plus petit qu'un 
intervalle de confiance 
a 99%. II risque moins 
de contenir la valeur 
moyenne p. 


Exemple : 

Une universite comporte 1500 etudiants. On mesure la taille de 20 d'entre eux. La moyenne ju e et l'ecart-type a e 


calcules a partir de cet echantillon sont : 


p e = 176 cm et a e = 6 cm 


Nous avons deja estime ponctuellement les parametres de la population 


'll = 176 cm et o = 


'20 

19 


x 6 ^ 6,16 cm 


Determinons maintenant une estimation de p par intervalle de confiance a 95% (ou au risque de 5 %). 
Notons X la variable aleatoire correspondant a la moyenne d'un echantillon de taille 20 pris au hasard. 


f 


Nous savons que : 






a 


v 


A ( 

- N 


nj 


P ; 


a 


A 


v 


V20 


j 


On calcule un rayon r tel que : 


P(p - r % X < \a + r) = 0,95 


On pose T = 


X-r 


a 


ainsi T suit la loi normale centree-reduite ; 1). 


V20 

Nous avons done : 


^ rV 20 . „ . r 


<c J <c 


V20^ 


V 


a 


a 


= 0,95 


J 


2YI 


( rj_ 20^ 
a j 


- 1 = 0.95 


^ -V 2 (P 


n 


v a J 


= 0.975 


11(f) = 0,975 out = 


•V20 


a 


Nous cherchons done, par lecture inverse de la table de la loi normale centree reduite une borne t telle que 


Yl(t) = 0,975 


La borne t= 1,96 convient. 


Ainsi, notre reel r recherche est tel que : 


•V20 


= 1,96 


a 
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1,96xg 

r Wo 

Mais une fois l'echantillon tire, nous avons obtenu un ecart-type estime a ^6,16 cm. 

D'ou : r ^ 2,7 

La realisation de l'intervalle de confiance a 95% sur cet echantillon est : 

IC = [176 - 2,7 ; 176 + 2,7] 

IC = [173,3 ; 178,7] 

Nous pouvons done estimer, avec une confiance de 95 % que la taille moyenne de la population est comprise 
entre 173,3 cm et 178,7 cm. 


B.2. Estimation d'une proportion 

B.2.1. Estimation ponctuelle 

Contexte : on considere un caractere (ou attribut) A sur une population dont la proportion p est inconnue. On 
suppose que l'on a preleve un echantillon de taille n (tirage avec remise ou assimile) sur lequel on a calcule la 
proportion p t d'indi vidus ayant le caractere A. 

Notons F la variable aleatoire correspondant a la proportion du caractere A dans un echantillon de taille n pris 
au hasard. On rappelle qu'alors F suit approximativement une loi normale : 

F*>n[p ;ct p ) ou a p = J P<1 ~ P) 


Une estimation ponctuelle p de la proportion p de l'attribut A dans la population est 


P =Pe 


Une estimation ponctuelle de l'ecart-type o p est selon le cas : 


n 


n - 1 


PeO-~Pt) 


n 


si „ < 30 

n — 1 


1 


An 


PP FM si „ > 30 

n 


si statisticien pessimiste 


Correction de biais. 


Ces estimations ponctuelles de 
l'ecart-type ne sont pas utiles dans 
Timmediat. Elle serviront pour la 
determination d'un intervalle de 
confiance de la proportion. 


Exemple : 

V 

A quelques jours d'une election, un candidat fait effectuer un sondage. Sur les 150 personnes interrogees, 45 se 
disent pretes a voter pour lui aux prochaines elections. 

La proportion d'individus prete a voter pour ce candidat dans l'echantillon est ici de p e = 


45 

150 


= 0,3. 


On estime done qu'il en est de meme dans la population (comment pourrait-on faire autrement ?) 




P =Pc = 0,3 


Quand a l'indication <j p , on peut ici l'estimer par : 


lPe( 1 ~Pt)_ /0,3 X 0, 7 _ 0 037 


(Jp 


n 


150 
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On voudrait aller plus loin et, au lieu d'une simple proportion, calculer un intervalle contenant, avec une 
confiance arbitraire fixee au depart, la proportion p d'individus prets a voter pour ce candidat. 


B.2.2. Estimation par intervalle de confiance 

Le contexte est le meme que le precedent. Nous avons vu, dans la theorie sur l'echantillonnage, que si F est la 
variable aleatoire correspondant a la proportion d'un caractere dans un echantillon de taille n pris au hasard, 
alors F suit approximativement une loi normale : 


N[p ;o p ) ou cs p = J- 


pO - p) 


n 


Nous avons deja remarque que le fait que p soit inconnu n'est pas genant dans les calculs a priori. Le probleme 

I p( 1 — p ) 

ici, c'est que nous ne connaissons pas l'ecart-type. . Nous le remplagerons, dans la phase a posteriori , 

V n 


11 / • ,Pe(l~Pe) . , , / P e (1 — P e ) . , . t . 

par son estimation ponctuelle (qui est — en general ou A— — si la correction de biais nest 


n — 1 


n 


pas proposee ou encore 



si nous voulons une hypothese pessimiste). 


Cherchons un intervalle qui contient p avec une confiance arbitraire de 90 % (cela pourrait etre un autre coefficient de 
confiance). Nous cherchons done un rayon r tel que : 

P(F - r F p ^ F + r) = 0,90 


Nous avons deja vu que cette probabilite pouvait s'ecrire de maniere plus pratique 



On sait que la variable aleatoire T = 


F - p 


a 


suit la loi normale centree reduite N(0 ; 1). 


p 


Nous obtenons done, par centrage et reduction : 


p-r- p t - p ^ p + r- p 


< 


V 


a 


a 


= 0,90 


p 


f \ 

—r r 

$: 7 <c 


V G . 


a 


= 0,90 


p 


111 


f \ 

r 


v a /v 


- 1 = 0,90 


n 


r ^ 

r 


v a /v 


= 0,95 


On cherche une borne t telle que : 


n(0 = 0,95 avec t = 


a 


Par lecture inverse de la table de la loi normale centree reduite N(fi ; 1) 


*=1,645 


Ce qui nous permet de calculer r : r = t o p 

Supposons maintenant l'echantillon preleve. Nous avons done une estimation pontuelle de p et o p . 
Ainsi, la realisation de l'intervalle de confiance dans l'echantillon est : 
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IC = 




n-i 


n - 1 


On ne retiendra pas cette formule. 
Dans la pratique, on refait les calculs. 


Remarques : 

• Si on n'effectue pas la correction de biais, l'intervalle de confiance est 


IC = 


P ,~ ijiM ; p, + J p ' ,, - p ’ > 


n 


n 


On peut egalement se placer dans une hypothese pessimiste en choisissant un ecart-type maximal. Nous 

1 1 

savons que la parabole d'equation y = x( 1 - x) admet un maximum egal a — en — . 

4 2 


Ainsi l'ecart-type maximal est 


1 


4 n 


. II a, de plus, l'avantage d'etre independant de p. 


Dans ce cas, la realisation de l'intervalle de confiance dans l'echantillon est : 


IC = 


1 I 1 

Pq ; Pe+t 


An 


An 


Exemple : 

A quelques jours d'une election, un candidat fait faire un sondage. Sur les 150 personnes interrogees, 45 se 
disent pretes a voter pour lui aux prochaines elections. 

45 

La proportion d'individus prete a voter pour ce candidat dans l'echantillon est ici de p t = ^,3- 

On a deja estime ponctuellement : P =P& = 0,3 et ^ — 0,037 


Determinons maintenant une estimation de p par intervalle de confiance a 80%. 


Notons F la variable aleatoire correspondant a la proportion d'individus prets a voter pour ce candidat dans un 
echantillon de taille 150 pris au hasard. 


Nous avons vu qu'approximativement : 


F *+ N(p ;cr p ) ouo p=J- 


p0 ~ P) 


n 


On cherche un rayon r tel que : 


Pip - r F T 7 F /; + r) = 0,8 


2n 


f \ 

r 


v a /v 


- 1 = 0,8 


n 


( \ 

r 


\ G p j 


= 0,9 


Par lecture inverse de la table de la loi normale centree-reduite, on cherche une borne t telle que 


n(0 = 0,9 avec t = 


a 


La valeur t ^ 1,28 convient done : r = 1,28 <j p 

Supposons maintenant l'echantillon preleve. Une estimation ponctuelle de o p est — 0,037. 
D'ou : r - 0,047 


La realisation de l'intervalle de confiance dans cet echantillon est alors 


1C = [0,3 - 0,047 ; 0,3 + 0,047] 

IC = [0,253 ; 0,347] 

IC% = [25,3 ; 34,7] 

Nous pouvons estimer, avec une confiance de 80 %, que la proportion d'indi vidus dans la population prets a 
voter pour le candidat en question est comprise entre 25,3 % et 34,7 %. 


Exercice : 

Une usine fabrique des cables. Un cable est considere comme conforme si sa resistance a la rupture X est 
superieure a 3 tonnes. L'ingenieur responsable de la production voudrait connaitre, en moyenne, la resistance a 
la rupture des cables fabriques. 

II n'est, bien sur, pas question de faire le test sur toute la production (l'usine perdrait toute sa production !). 

Un technicien preleve done un echantillon de 100 cables dans la production. Notons X la variable aleatoire 
correspondant a la force a exercer sur le cable pour le rompre. Le technicien obtient les resultats suivants : 

E{ X ) = 3,5 tonnes 
a( X ) = 0,4 tonne 

Proportion de cables dont la resistance est superieure a 3 tonnes : p t = 0,85 

1. a. Donner une estimation ponctuelle de la moyenne p et de l'ecart-type a de la variable aleatoire X dans la 

production. 

b. Determiner une estimation par intervalle de confiance a 95 % de la moyenne p de X. 

2. a. Donner une estimation ponctuelle de la proportion p de cables conformes dans la production, 
b. Determiner une estimation par intervalle de confiance a 90 % de cette proportion. 
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- RESUME - 

- Echantillonnage - 



MOYENNE 


Echantillons de taille n de moyenne X 


N 


( 


a 


A 


p ; 

v dnj 


ou jli et a sont la moyenne et l'ecart-type 
dans la population. 


PROPORTION 

Echantillons de taille n avec une frequence F 


( 


N 


P\ 


. pQ-p) 


V 


n 




J 


ou p est la proportion dans la population. 


- Estimation - 



Coefficient de confiance 

80% 

90% 

95 % 

99 % 

Valeur de np) 

0,9 

0,95 

0,975 

0,995 

Borne t 

1,28 

1,645 

1,96 

2,575 


PROPORTION 


Proportion inconnue p dans une population. 
Echantillon de taille n connu avec une proportion p t 


Une estimation ponctuelle de p est p & . 


^ Une estimation ponctuelle de <j p est 


PtQ--Pt) ■ 

ul 


n — 1 


n ^ 30 ou d ^-— — sinon ( n > 30). 


n 


Pour estimer p par intervalle avec une confiance C 
(par ex 95%), on cherche un rayon r tel que : 


Pip - r % T 7 % / ; + r) = C 


ou F ^ N [p avec a p =J 


p0 ~ P) 


n 


On exprime r en fonction de a p et on remplace o p par 

son estimation ponctuelle. 


IC = \p Q ~ r ; p t + r] 


MOYENNE 


Population de moyenne jjl inconnue et d'ecart-type cr. 
Echantillon de taille n connu de moyenne p e et d'ecart-type a e 


^ Une estimation ponctuelle de p est p e . 


Une estimation ponctuelle de a est 


n 


n - 1 


a P si n ^ 30 ou 


tout simplement a e sinon (n > 30). 


Pour estimer p par intervalle avec une confiance C (par 


ex 95%), on cherche un rayon r tel que : 

P(p - r % Y ^ p + r) = C 


f 


ou X ^ N 


p ; 


a 


A 


v 


nj 


On exprime r en fonction de a et on remplace a par sa valeur 
connue ou son estimation ponctuelle. 

IC = [pe - r ; p e + r\ 


